import nltk
import os

# 检查 NLTK_DATA 环境变量，如果已设置则跳过下载
if not os.getenv('NLTK_DATA'):
    # 只在开发环境中下载，生产环境已在 Dockerfile 中预下载
    nltk.download('averaged_perceptron_tagger', quiet=True)
    nltk.download('punkt', quiet=True)
    nltk.download('maxent_ne_chunker', quiet=True)
    nltk.download('words', quiet=True)
    nltk.download('stopwords', quiet=True)

from .DocExtraction import RapidOCRDocLoader 